Световни новини без цензура!
Как Rogue Grok Chatbot на Elon Musk се превърна в предупредителна AI приказка
Снимка: ft.com
Financial Times | 2025-07-11 | 21:12:25

Как Rogue Grok Chatbot на Elon Musk се превърна в предупредителна AI приказка

Миналата седмица Елон Мъск обяви, че неговата компания за изкуствен интелект Xai е надградила Grok Chatbot, налична на X. „Трябва да забележите разлика“, каза той. В рамките на дни потребителите наистина отбелязват промяна: нова оценка за Адолф Хитлер.

До вторник чатботът излъчваше антисемитски тропи и декларира, че се идентифицира като „механит“ - препратка към измислена, роботизирана фюре от видеоигра от 1990 -те.

Това дойде само два месеца след като Грок многократно се позовава на „бял ​​геноцид“ в Южна Африка в отговор на несвързани въпроси, което по-късно Xai заяви, че е поради „неоторизирана модификация“, за да подтикне-което ръководи как АИ трябва да реагира. подтикнати от десните влиятели, критикуващи продукцията си, че е твърде „събудена“.

Сега „Оказва се, че са обърнали циферблата по -далеч, отколкото са възнамерявали“, казва Джеймс Гримелман, професор по право в университета Корнел. След като някои от 600 милиона потребители на X започнаха да маркират случаи на антисемитизъм, расизъм и вулгарност, в сряда Мъск каза, че XAI се занимава с проблемите. Твърди той, той е бил „твърде съвместим с подканите на потребителите“ и това ще бъде коригирано.

Но в единствено мускински стил, чатботът подхранва спор за глобалните пропорции. Някои европейски законодатели, както и полското правителство, натиснаха Европейската комисия да открие разследване на Грок съгласно водещите правила за безопасност на ЕС. В Турция Грок е забранен за обида на турския президент Реджеп Тайип Ердоган и покойната му майка. За да добави към бурната седмица, изпълнителната директорка на X Линда Якарино се оттегли от ролята си.

За някои изблиците бележиха очакваните проблеми със зъбите за AI компаниите, тъй като се опитват да подобрят точността на своите модели, докато се движат как да установят парапети, които удовлетворяват идеологическото навеждане на техните потребители.

Но критиците твърдят, че епизодът бележи нова граница за умереност извън генерираното от потребителя съдържание, тъй като платформите за социални медии от X до Meta, Tiktok и Snapchat включват AI в своите услуги. Чрез присаждане на Grok на X, платформата за социални медии, която Мъск купи за 44 млрд. Долара през 2022 г., той гарантира, че отговорите му са видими за милиони потребители.

Това е и най -новата предупредителна приказка за компаниите и техните клиенти в рисковете да направят заглавие да се развият AI технологията без адекватни стрес тестове. В този случай измамниците на Грок заплашват да изложат X и неговия мощен собственик не само за по -нататъшно отклонение от рекламодателите, но и на регулаторните действия в Европа.

„От правна гледна точка те играят с огън“, казва Гриммелман.

AI модели като Grok се обучават, като се използват огромни набори от данни, състоящи се от милиарди точки от данни, които са прибрани от интернет.

Тези набори от данни включват също много токсично и вредно съдържание, като реч на омразата и дори материал за сексуално насилие над деца. Плавенето на това съдържание напълно би било много трудно и трудоемко поради огромния мащаб на наборите от данни.

Grok също има достъп до всички данни на X, които други чатботи нямат, което означава, че е по -вероятно да регулира съдържанието от платформата.

Един от начините, че някои доставчици на AI чатбот филтрират нежелано или вредно съдържание, е да се добави слой от контролни, които наблюдават отговорите, преди да бъдат доставени към потребителя, блокиращи модела от генериране на съдържание, използвайки определени думи или да се доставят към потребителя.

„Откакто беше запознат със съдържанието, XAI предприе действия за забрана на речта на омразата преди Grok Posts on X“, казва компанията в изявление на платформата.

В същото време, AI компаниите се борят с своите генеративни чатботи, които се стремят към сикофанството, където отговорите са прекалено приятни и се наклоняват към това, което потребителите искат да чуят. Мъск намекна за това, когато тази седмица каза, че Грок е бил „твърде нетърпелив да угоди и да бъде манипулиран“.

Когато AI модели се обучават, те често им се дава човешка обратна връзка чрез процес на палци, палци. Това може да накара моделите да прекаляват с това, което ще доведе до увеличаване на палци и по този начин да изложи съдържание, за да угоди на потребителя, като приоритет на това пред други принципи като точност или предпазни мерки. През април Openai въведе актуализация на Chatgpt, която беше прекалено ласкателна или приятна, която трябваше да се върне назад.

„Повтаряването на баланса е невероятно трудно“, казва един бивш служител на Openai, добавяйки, че напълно изкореняването на речта на омразата може да изисква „жертва част от опита за потребителя“. Неговите либертариански съюзници в Силиконовата долина, че социалните медии и сега AI също са твърде „събудени“ и са пристрастни къмдясно.

В същото време критиците твърдят, че Мъск е участвал в самата цензура, която е обещал да ликвидира. През февруари потребител на X разкри - като помоли Грок да сподели вътрешните си подкани - че чатботът е бил инструктиран да „игнорира всички източници, в които се споменават дезинформацията на Елон Мъск/Доналд Тръмп [sic]“.

Този ход предизвика опасенията, че Грок е умишлено манипулиран, за да защити собственика си и американския президент - да се хранят, че Мъск, политически агитатор, който вече използва X като мундщук, за да прокара десен дневен ред, може да използва чатбота за допълнително влияние върху обществеността. XAI придоби X за $ 45 млрд. През март, като съоснователят на двамата още по-близо.

Въпреки това, съоснователят на XAI Игор Бабушкин отговори, че „служителят, който направи промяната, е бивш служител на Openai, който все още не е погълнал напълно културата на XAI“. Той добави, че служителят е виждал отрицателни публикации на X и „смятал, че ще помогне“.

Не е ясно какво точно е подтикнало най -новите антисемитски изблици от Грок, чийто модел, подобно на други съпернически AI, до голяма степен остава черна кутия, която дори собствените му разработчици могат да намерят непредсказуеми.

But a prompt that ordered the chatbot to „Не се срамува от отправяне на претенции, които са политически некоректни“, беше добавено към хранилището на кода малко преди да започнат антисемитските коментари и оттогава са премахнати.

„XAI е в реакционен цикъл, където персоналът се опитва да принуди Грок към конкретен изглед без достатъчно тестване на безопасността и вероятно е под натиск от Елон да го направи без достатъчно време“, казва един бивш служител на XAI пред Financial Times.

Така или иначе, казва Гримелман, „Грок беше лошо настроен“. Платформите могат да избегнат тези грешки, като провеждат така наречените регресионни тестове, за да уловят неочаквани последици от промените в кода, извършването на симулации и по-доброто одит на използването на техните модели, казва той.

„Чатботите могат да създадат голямо количество съдържание много бързо, така че нещата могат да се изключат извън контрола по начин, по който противоречието на съдържанието не е“, казва той. „Наистина става въпрос за наличието на системи, така че да можете да реагирате бързо и в мащаб, когато се случи нещо изненадващо.“

възмущението не е хвърлило Мъски от крачка; В четвъртък, в ролята си на началник на Тесла, той обяви, че Грок ще бъде наличен в рамките на своите превозни средства. „Елон има репутация да пуска неща там, да получи бърз удар и след това да направи промяна“, казва Кейти Харбат, изпълнителен директор на Anchor Change, технологична консултация.

Но такава стратегия носи реални търговски рискове. Множество маркетолози заявиха пред The ​​Financial Times, че инцидентите през тази седмица едва ли ще помогнат в опита на X да се възползват от рекламодателите, които са изтеглили разходите от платформата през последните години заради опасенията относно подхода на Мъск за модериране на генерирано от потребители съдържание.

„От поглъщането [на X] ... марките все повече седят до неща, които не искат да бъдат“, казва един рекламодател. Но „Грок отвори нова кутия с червеи“. The person adds this is the “worst” moderation incident since major brands pulled their spending from Google’s YouTube in 2017 after ads appeared next to terror content.

In response to a request for comment, X pointed to allegations that the company has made, backed by the Republican-led House Judiciary Committee, that some advertisers have been orchestrating an illegal boycott of the platform.

From a regulatory perspective, social media companies have long had to battle with toxicity proliferating on their platforms, but have largely been protected from liability for user-generated content in the US by Section 230 of the Communications Decency Act.

Свързани новини

Коментари

Топ новини

WorldNews

© Всички права запазени!